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(57) Abstract 

The invention concerns a microprocessor (MP) comprising means for decoding (DEC 1 ) a compact instruction (BMV) for concatenating 
at least one bit (bi) of a first binary word (Wl) with at least one bit of a second binary word (W2), and means (REGBANK, MUX, BSHIFT) 
for processing said instruction in one clock cycle. The invention provides the advantage of ensuring a rapid concatenation operation and is 
particularly applicable to smart cards. 


(57) Abi^gl 

L'invention concernc un microprocesseur (MP) comprenant des moycns de d6codage (DEC1) d'une instruction compacte (BMV) de 
concatenation d'au moins un bit (bi) d'un premier mot binairc (Wl) avec au moins un bit d'un deuxieme mot binairc (W2), et des moyens 
(REGBANK, MUX, BSHTFT) de traitement de cette instruction en un cycle d'horioge. Avantages: traitement rapide d'une operation de 
concatenation. Application notamment aux cartes a puce. 
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MICROPROCESSEUR COMPRENANT DES MOYENS 
DE CONCATENATION DE BITS 


La presente invention concerne les 

microprocesseurs, et plus particulierement la realisation 
dans un microprocesseur d'une operation de concatenation 
d'au moins un bit d'un premier mot binaire avec des bits 

5 d'un deuxieme mot binaire. 

La concatenation de bits est une operation 
frequemment utilisee en informatique industrielle. En 
particulier, les codes d* authentif ication emis par les 
cartes a microprocesseur comme les cartes bancaires sont 

10 generes par des algorithmes de cryptographie necessitant 
de nombreuses operations de concatenation de bits. Or, 
les microprocesseurs classiques presentent 1 1 inconvenient 
de consommer plusieurs cycles d'horloges et plusieurs 
octets de code programme pour realiser cette operation. 

15 Par exemple, avec un microprocesseur du type 6805 

la concatenation de bits est faite au moyen des 
instructions "BRSET" et "BCLR" et necessite tout d'abord 
la mise a 1 des bits d'une zone memoire destinee a 
contenir le resultat de 1 ! operation. Ensuite, on teste la 

20 valeur d'un premier bit a concatener et on met a 0 le 
premier bit de la zone memoire si le bit a concatener est 
egal a 0. Puis, on teste la valeur d'un deuxieme bit a 
concatener et on met a 0 le deuxieme bit de la zone 
memoire si le deuxieme bit a concatener est egal a 0, 

25 etc.. La concatenation de chaque bit dans la zone memoire 
necessite cinq octets de code programme (instructions et 
adressage de la memoire compris) et le temps d 1 execution 
est de dix cycles machine environ. 
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Dans un microprocesseur du type 8051, on charge 
tout d'abord le bit a concatener dans un drapeau 
("flag"), par exemple le drapeau CRY ("Carry"). Ensuite, 
on insere le bit dans le registre de travail du 
5 microprocesseur, par decalage a droite du registre au 
moyen de 1 ' instruction "ROR" ou par insertion directe au 
moyen de 1 1 instruction "MOV" . Enfin, le contenu du 
registre de travail est charge en m§moire. Ces operations 
consomment egalement plusieurs octets de code et 
10 plusieurs cycles machine. 

En definitive, les microprocesseurs de I'art 
anterieur executent avec lenteur un programme contenant 
un grand nombre d 1 operations de concatenation et 
necessitent, pour chaque operation de concatenation, 
15 l'ecriture de plusieurs codes programme. 

On connait par ailleurs des microprocesseurs 
sophistiques du type pipeline, c'est-a-dire & 
chevauchement d' instructions, dont l'avantage est de 
fonctionner a grande vitesse. Toutefois, ces 
20 microprocesseurs sont d'une complexity, d f un encombrement 
et d'un cout de revient qui les rendent impropres a etre 
integres dans des cartes a puce. 

En particulier, les cartes a puce sans contact 
alimentees par induction electromagn^tique possedent de 
25 faibles ressources en energie electrique et doivent etre 
equipees d'un microprocesseur qui consomme peu de courant 
tout en etant rapide et apte a traiter une transaction 
dans un temps tres court, de l'ordre de quelques 
millisecondes. 

30 Par ailleurs, l f article de Wai Lung Loh intitule 

"BEE: a special-purpose machine for hardware description 
languages", paru dans la revue Microprocessors and 
Microsystems, vol. 19, n°5, juin 1995, decrit un 
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emulateur de circuits hardware programme au moyen d'un 
langage specif ique VHDL (Hardware Description Language) . 
Cet article propose de faciliter la simulation 
d' operations de manipulation de chaines de bits en 
5 realisant un circuit hardware appele BEE ("Bit string 
Emulator Engine") prenant en charge 1' execution de telles 
operations. Toutefois, le circuit BEE est complexe et se 
prete mal a une incorporation dans un microprocesseur 
destine aux cartes a puce. 
10 Enfin, le brevet US 4 023 023 decrit un circuit 

hardware permettant de realiser diverses operations de 
decalage et de concatenation de bits a partir de deux 
mots binaires fournis en entree. 

Un objectif general de la presente invention est de 
15 pr^voir un microprocesseur qui incorpore un circuit 
hardware de concatenation de bits tout en §tant de 
conception simple, de faible encombrement et de faible 
consommation, et qui offre une grande rapidite de 
traitement des instructions d'un programme, notamment 
20 d'une instruction de concatenation. 

Cet objectif est atteint par la prevision d'un 
microprocesseur pipeline comprenant des moyens de 
decodage d ! une instruction de concatenation d'au moins un 
bit d'un premier mot binaire avec au moins un bit d'un 
25 deuxieme mot binaire ; une banque de registres ; des 
moyens de traitement de 1 ' instruction de concatenation ; 
un premier etage pipeline comprenant les moyens de 
decodage de 1 ' instruction de concatenation ; un deuxieme 
etage pipeline, contigu au premier 6tage, comprenant un 
30 premier secteur comprenant des moyens de concatenation, 
dans lequel la banque de registres est agencee en 
lecture, et un deuxieme secteur dans lequel la banque de 
registres est agencee en ecriture, le premier secteur 
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etant actif a chaque demi-cycle d'horloge du 
microprocesseur et le deuxieme secteur actif a chaque 
demi-cycle d'horloge suivant, les moyens de traitement de 
1 1 instruction de concatenation etant agences pour lire 

5 les premier et deuxieme mots binaires dans la banque de 
registres et executer 1' instruction de concatenation au 
cours d'un premier demi-cycle d'horloge, et enregistrer 
le resultat de la concatenation dans la banque de 
registres au cours du demi-cycle d'horloge suivant. 

10 Avant a g e u s erne n-t , les moyens de concatenation 

comprennent des moyens de presentation en parallele, sur 
le chemin de donnees du microprocesseur, des deux mots 
binaires lus dans la banque de registres, des moyens de 
selection d'au moins un bit a concatener du premier mot 

15 binaire, et des moyens pour decaler des bits du deuxieme 
mot binaire sur le chemin de donnees et inserer dans le 
deuxieme mot binaire au moins le bit selectionne du 
premier mot binaire. 

Avantageusement, les moyens pour d§caler des bits 

20 comprennent un circuit a commutation materielle de fils 
agence pour, sur reception d'un signal de decalage, 
decaler le rang des fils du chemin de donnees et 
connecter & au moins un fil du chemin de donnees la 
sortie des moyens de selection du bit a concatener. 

25 Selon un mode de realisation, les moyens de 

selection d'au moins un bit comprennent un circuit 
multiplexeur agence sur le chemin de donnees pour 
recevoir en entree le premier mot binaire. 

Selon un mode de realisation, le deuxieme mot 

30 binaire est lu dans la banque de registres a l'adresse 
d' enregistrement du resultat de la concatenation. 

Selon un mode de realisation, le microprocesseur 
comprend des moyens de decodage d'une instruction 
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compacte de concatenation comportant une adresse compacte 

d'enregistrement du resultat de la concatenation. 

Selon un mode de realisation, le microprocesseur 

comprend des moyens de decodage d'une instruction de 
5 concatenation dont le code comporte une adresse compacte 

pr^determinee d'enregistrement du resultat de la 

concatenation . 

Selon un mode de realisation, les moyens de 

decodage de 1 ' instruction de concatenation sont agenc6s 
10 pour gen§rer une adresse fixe et predeterminee 

d'enregistrement du resultat de la concatenation. 

Ces caracteristiques ainsi que d f autres de la 

presente invention seront exposees plus en detail dans la 

description suivante, faite a titre non limitatif, d'un 
15 exemple de realisation d'un microprocesseur selon 

1' invention, en relation avec les figures jointes parmi 

lesquelles : 

la figure 1 represente sous forme de blocs les 
principaux elements d'un microprocesseur selon 
20 1' invention, 

- la figure 2 represente un circuit a decalage selon 
l 1 invention, represente schematiquement en figure 1, et 

- la figure 3 represente un element interrupteur du 
circuit & decalage de la figure 2. 

25 La figure 1 represente un microprocesseur MP selon 

1' invention, fonctionnant ici sous 16 bits et du type 
pipeline, c'est-a-dire a chevauchement d' instructions . Le 
microprocesseur est organise pour executer des 


instructions 
suivant : 

compactes se 

presentant sous le format 

CODEqp 

ADRd 

ADRs 
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Ces instructions, codees ici sur 16 bits, 
comprennent un code C0DE 0 p de 1' operation a executer, 
code sur 4 bits, l'adiresse ADRd d'un registre Rd de 
destination du resultat, sur 4 bits, et l'adresse ADRs 

5 d'un registre source Rs, sur 4 bits (ici, le dernier 
champ de 1 1 instruction n'est pas utilise). L'operation 
est par exemple l 1 addition ADD (additionner Rs et Rd et 
stocker le resultat dans Rd) , la soustraction SUB 
(soustraire Rs & Rd et stocker le resultat dans Rd) , le 

10 OU logique (stocker dans Rd le resultat de Rs OU Rd) , le 
ET logique, etc.. 

Selonl ' invention, le microprocesseur est 6galement 
organise pour executer une instruction compacte de 
concatenation BMV, selon le format suivant : 

15 


CODEbmv 

ADRd 

ADRs 

ADbi 


Cette instruction comprend le code CODEbmv de 
l'operation de concatenation, sur 4 bits, l ! adresse ADRd 
du registre Rd de destination du resultat de la 
20 concatenation, sur 4 bits, l'adresse ADRs d f un registre 
source Rs, sur 4 bits, et l'adresse (ou rang) ADbi d'un 
bit bi du registre source Rs. 

Cette instruction signifie ici, de fagon non 
limitative : 

25 1) lire un mot binaire Wl dans le registre Rs 

2) lire un mot binaire W2 dans le registre Rd, 

3) concatener ("accoler") le bit bi du mot binaire Wl 
avec le bit de plus fort poids du mot binaire W2, 

4) enregistrer dans le registre Rd le mot W3 comprenant 
30 le resultat de la concatenation. 


WO 99/23550 


7 


PCT/FR98/02266 


Comme on le verra plus loin, ces diverses etapes 
sont avantageusement realisees en un seul cycle 
d'horloge. 

On decrira tout d'abord la structure generale du 
5 microprocesseur selon 1' invention, qui comprend une 
memoire programme MEM, une banque de registres REGBANK, 
une unite de calcul arithmetique et logique ALU, un 
compteur ordinal PC, un circuit SPC d ! incrementation du 
compteur ordinal PC et un decodeur DEC1 d' instructions. 
10 Le microprocesseur comprend egalement des moyens de 
concatenation prenant la forme d'un circuit a decalage 
BSHIFT et un circuit MUX de selection, en fonction de 
l'adresse ADbi, du bit bi a concatener. 

Le decodeur DEC1, 1' unite ALU et la banque REGBANK, 
15 representes sous forme de blocs, sont des circuits ou des 
ensembles de circuits bien connus de l'homme de l'art et 
leur structure interne ne sera pas decrite. Le decodeur 
DEC1 est connecte a la sortie de la memoire MEM pour 
recevoir les instructions d'un programme a executer. 
20 L' unite ALU comporte ici deux entrees INI, IN2, une 
sortie OUT, et est pilotee par un decodeur DEC2. La 
banque de registres REGBANK contient divers registres de 
travail, par exemple seize registres RO a R15 (non 
representes) . La banque REGBANK comporte une entr§e IADRs 
25 pour l f adresse ADRs du registre source Rs, une entree 
IADRd pour l'adresse du registre de destination Rd, une 
sortie OUTRs de lecture du registre source Rs, une sortie 
OUTRd de lecture du registre de destination Rd, et une 
entree INRd pour l'ecriture d'un resultat dans le 
30 registre de destination Rd. La sortie OUTRd de la banque 
REGBANK est connectee a l 1 entree INI de 1 ' unit£ ALU. La 
sortie OUTRs est connectee a 1' entree IN2 de 1' unite ALU 
et a 1' entree du circuit MUX. 
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Le circuit BSHIFT comprend seize entrees cle bits e 0 
a eis connectees a la sortie OUT de l r unit6 ALU, une 
entree auxiliaire eu connectee a la sortie du circuit 
MUX, et seize sorties de bits so a s 15 formant la 
5 terrainaison du chemin de donnees DPTH du microprocesseur, 
ces sorties 6tant connectees a 1' entree INRd de la banque 
REGBANK. 

Ainsi, le chemin de donnees DPTH du microprocesseur 
comprend tout d 1 abord deux voies de seize f ils a la 
10 sortie de la banque REGBANK, puis une vole de seize fils 
et un fil auxiliaire a 1' entree du circuit BSHIFT, et 
enfin une voie de seize fils de la sortie du circuit 
BSHIFT jusqu'a 1' entree de la banque REGBANK. 

D'autres connexions de la terminaison du chemin de 
15 donnees DPTH sont bien entendu envisageables, par exemple 
une connexion a la memoire MEM ou a une autre memoire de 
stockage de donnees. 

Le circuit BSHIFT est pilote par un signal SR. 
Quand ce signal est a 0, le circuit BSHIFT est 
20 transparent et les sorties Si 5 a s 0 recopient les entrees 
e i5 a e 0 . Quand le signal BSHIFT est a 1, le circuit 
decale ses sorties relativement a ses entrees. Les 
sorties Si 4 a s 0 recopient les entrees e i5 a ei, 
respect ivement, et la sortie s i5 recopie l 1 entree 
25 auxiliaire e i6 . Dans ce cas, l 1 entree e 0 est deconnectee 
du chemin de donnees. 

Selon 1' invention, le microprocesseur est par 
ailleurs organise en deux etages pipeline ST1, ST2 
contigus, delimites par des registres a verrouillage Bl, 
30 B3 (ou "latch") . Ces registres Bl, B3 sont deverrouilles 
par le front montant d'un signal d'horloge HI, La memoire 
MEM et le decodeur DEC1 sont agences dans le premier 
etage STl. La banque REGBANK, 1' unite ALU, le 
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raultiplexeur MUX et le circuit BSHIFT sont agences dans 
le deuxieme 6tage ST2. 

Les deux etages ST1, ST2 sont divises chacun en 
deux secteurs ST11/ST12, respectivement ST21/ST22. Les 
5 secteurs ST11/ST12 sont delimites par un registre B2 
agence entre la sortie de. la memoire MEM et le decodeur 
DEC1. Les secteurs ST21/ST22 sont delimites par un 
registre B4 agenc§ entre les sorties s 0 a si 5 du circuit 
BSHIFT et I 1 entree INRd de la banque REGBANK. Le registre 
10 B2 est un registre a verrouillage deverrouille par le 
front montant d'un signal H2 dephase de 180° relativement 
au signal HI. Le registre B4 est de preference un tampon 
trois etats ("buffer tristate") transparent quand le 
signal H2 est a 1, et dans l'etat haute impedance quand 
15 le signal H2 est a 0. Ainsi, le signal d'horloge HI 
synchronise le transfert des donnees de 1' etage ST1 vers 
1' etage ST2, et le signal H2 synchronise le transfert des 
donnees du premier secteur ST11, ST21 vers le deuxieme 
secteur ST12, ST22 de chaque etage pipeline. Pour fixer 
20 les id6es, les signaux d'horloge HI et de transfert H2 
sont representes au bas de la figure 1. 

La banque REGBANK est commandee en lecture par un 
signal RDH1 et en ecriture par un signal WRH2. Ces 
signaux sont envoyes par le decodeur DEC1. Le signal de 
25 lecture RDH1 est §mis quand le signal d'horloge HI passe 
& 1 et le signal d 1 ecriture WRH2 est emis quand le signal 
H2 passe a 1. La banque REGBANK appartient ainsi r en 
lecture, au premier secteur ST21 de 1' etage ST2 et, en 
ecriture, au deuxieme secteur ST22 de 1' etage ST2 . 
30 Enfin, la memoire MEM delivre 1 ' instruction 

contenue a l'adresse fournie par le compteur ordinal PC 
sur reception du signal de lecture RDH1. 
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Pour illustrer le fonctionnement du microprocesseur 
selon l 1 invention, on se referera par exemple a la 
sequence d' instructions suivante : 

(1) SUB R1,R2 (soustraire R2 a Rl et stocker le resultat 
5 dans Rl) 

(2) BMV R0,R1,12 (concatener dans R0 le bit de rang 12 
contenu dans Rl) . 

Ces instructions sont delivrees par la memoire MEM 
sous la forme suivante : 

10 


CODEsto 

ADR1 

ADR2 



CODEbmv 

ADRO 

ADR1 

12 


La sequence est executee par le microprocesseur 
selon des etapes 1.1 k 1.4 et 2.1 a 2.4 decrites ci- 

15 apres. Les diverses operations realisees au cours de 
chacune de ces Stapes se deroulent de fagon asynchrone 
selon le flot des donnees a travers les elements du 
microprocesseur, et sont considerees comme achevees a la 
fin de chaque etape. 

20 1.1 - HI = '1, H2 = 0, registre Bl deverrouille, 

secteur ST11 actif : 

- le decodeur DEC1 emet le signal de lecture RDH1 et 
l 1 instruction SUB Rl, R2 est lue dans la memoire MEM. 

1.2 - HI = 0, H2 = 1, registre B2 deverrouille, 
25 secteur ST12 actif : 

- le decodeur DEC1 decode l 1 instruction SUB Rl, R2, met 
le signal SR & 0, envoie les adresses ADR1 et ADR2 vers 
la banque REGBANK et envoie le code operation CODE S ub de 
la soustraction vers 1' unite ALU, 

30 - le circuit SPC incrSmente le compteur ordinal PC. 
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1.3 - HI = 1, H2 = 0, registre B3 deverrouille, 
secteur ST21 actif : 

- la banque REGBANK regoit les adresses ADR1, ADR2, le 
decodeur DEC2 regoit le code CODE S ub et le d6codeur DEC1 

5 emet le signal de lecture RDH1, 

- les registres Rl et R2 sont lus et leur contenu 
applique sur les entrees INI, IN2 de 1' unite ALU, 

- 1' unite ALU delivre le resultat de la soustraction [Rl- 
R2] . 

10 1.4 - Hi = 0, H2 = 1, registre B4 transparent, 

secteur ST22 actif : 

- le decodeur DEC1 emet le signal d'ecriture WRH2, 

- le circuit BSHIFT §tant transparent (SR=0) , le resultat 
de la soustraction [R1-R2] se retrouve sur 1' entree INRd 

15 de la banque REGBANK, 

- le resultat de la soustraction [R1-R2] est enregistre 
dans le registre Rl. 

2.1 - HI = 1, H2 - 0, registre Bl deverrouill6, 
secteur ST11 actif : 

20 - le decodeur DEC1 emet le signal de lecture RDH1 et 
1 1 instruction BMV R0,R1,12 est lue dans la memoire MEM. 

2.2 - HI = 0, H2 = 1, registre B2 deverrouill6, 
secteur ST12 actif : 

- le decodeur DEC1 decode 1 • instruction BMV R0,R1,12, met 
25 le signal SR a 1, envoie les adresses ADR1 et ADR2 vers 

la banque REGBANK, envoie l f adresse ADbi = 12 vers le 
multiplexeur MUX, et envoie le code operation CODEbmv cle 
la concatenation vers 1' unite ALU, 

- le circuit SPC incr&mente le compteur ordinal PC. 

30 2.3 - HI = 1, H2 = 0, registre B3 deverrouille, 

secteur ST21 actif : 

- la banque REGBANK re?oit les adresses ADR1, ADR2, le 
decodeur DEC2 regoit le code CODEbmv / le circuit MUX 
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regoit I'adresse ADB± (ici 12), le circuit BSHIFT re?oit 
le signal SR k 1 et le decodeur DEC1 emet le signal de 
lecture RDH1, 

- le mot binaire Wl contenu dans le registre Rl est 
applique sur 1* entree du multiplexeur MUX et le mot 
binaire W2 contenu dans le registre R0 est applique sur 
1' entree INI de 1' unite ALU, 

- selon 1' invention, l 1 unite ALU recopie sur sa sortie 
OUT le mot W2 present sur son entree INI, 

- le multiplexeur MUX selectionne le bit b i2 qui se 
retrouve sur 1' entree auxiliaire ei6 du circuit BSHIFT, 

- le circuit BSHIFT connecte les sorties s i4 a s 0 aux 
entrees eis a e if connecte la sortie S15 a 1' entree 
auxiliaire ei 6 , et delivre un mot binaire W3 de la forme 
suivante : 

W3 = bi2 C15 C14 C13 C12 Cn Cio c 9 c 8 c 7 c 6 c 5 c 4 c 3 c 2 Ci, 

dans lequel le bit de plus fort poids est le bit b i2 
selectionne dans le mot Wl. Les autres bits du mot W3 
sont des bits c i5 a ci du mot W2, le bit de plus faible 
poids c 0 ayant ete supprime par le decalage. 

2.4 - HI = 0, H2 = 1, tampon B4 transparent, 
secteur ST22 actif : 

- le mot W3 est applique sur l 1 entree INRd de la banque 
REGBANK, 

- le decodeur DEC1 emet le signal d'ecriture WRH2 et le 
mot W3 est enregistre dans le registre R0 de la banque 
REGBANK. 

Dans le microprocesseur pipeline selon l 1 invention, 
l es etapes qui viennent d'etre decrites se chevauchent 
comme indiqu6 dans le tableau 1 ci-apres. 
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Tableau 1 


Cycle pipeline 

Cycle pipeline 

Cycle pipeline 

1/2 cycle 

1/2 cycle 

1/2 cycle 

1/2 cycle 

*4 cycle 

1/2 cycle 

Hl=l 

H2=l 

Hl=l 

H2=l 

Hl=l 

H2=l 

etape 1.1 

etape 1.2 

etape 1.3 

etape 1.4 





etape 2.1 

etape 2.2 

etape 2.3 

etape 2.4 





etape 3.1 

etape 3.2 


Dans ce tableau, les etapes 3.1 et 3.2 sont des 
etapes de lecture et de decodage d'une nouvelle 
5 instruction (quelconque) suivant 1' instruction BMV. 

On voit que les etapes 2.3 et 2.4 sont realisees en 
un seul cycle d'horloge. Par ailleurs, en raison du 
f onctionnement pipeline du microprocesseur, les etapes de 
lecture 2.1 et decodage 2.2 chevauchent les etapes 1.3 et 
10 1.4 de 1' instruction precedente et ne consomment pas le 
temps d'horloge. 

La figure 2 represente un mode de realisation 
avantageux du circuit BSHIFT, au moyen de seize 
interrupteurs 10 a 115 commandes par le signal SR. Chaque 
15 interrupteur Ii est agence pour connecter une sortie si 
de rang i a une entree ei de meme rang ou a une entree 
e i+x de rang superieur, selon la valeur du signal SR. 
Comme illustre ■ par la figure 3, les interrupteurs Ii 
peuvent etre realises au moyen de deux interrupteurs CMOS 
20 Ti et T i+ i agences entre la sortie si et les entries e± et 
e i+i . Le signal SR est applique au transistor NMOS de 
1' interrupteur T i+ i et au transistor PMOS de 
I 1 interrupteur Ti. Un signal inverse /SR, delivre par une 
porte inverseuse, est applique au transistor PMOS de 
25 1 1 interrupteur T i+i et au transistor NMOS de 
1* interrupteur Ti. 
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Ce circuit BSHIFT a decalage de bits par 
commutation materielle de fils presente l'avantage, par 
rapport a un registre a decalage classique, de pouvoir 
recevoir le signal de decalage SR au commencement du 

5 cycle d'horloge HI avant que les donn^es ne soient 
stabilisees sur les entrees eie a eo. La prevision d'un 
registre a decalage classique reste toutefois 
envisageable, a la condition de prevoir un circuit a 
retard pour 1 1 application du signal SR. 

10 Pour fixer les idees sur les applications pratiques 

de 1' invention, le tableau 2 ci-apr6s d6crit la sequence 
de concatenation suivante : 

"Concatener dans RO = 1010 1010 1010 1010 
15 le bit 12 de Rl - 0001 0010 0011 0100, 

puis le bit 0 de R2 = 0010 0011 0100 0101, 
puis le bit 14 de R3 = 0011 0100 0101 0110, 
puis le bit 2 de Rl = 0001 0010 0011 0100". 


Tableau 2 


REGISTRE R0 

Bits (rang) 


15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 

R0 initial 


1010101010101010 

BMV R0,R1,12 

1 

1010101010101010 
1010101010101010 
1010101010101020 
1010101010101010 

BMV R0,R2,0 

1 1 

BMV R0,R3,14 

0 11 

BMV R0,R1,2 

10 11 


Les bits concat&nes dans le registre R0 sont en 
caracteres gras. Les bits en italiques sont les bits de 
poids faible perdus par decalage a droit e. Au total, la 
concat6nation des quatre bits ne necessite que quatre 
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cycles d'horloge pipeline et un programme de quatre 
instructions seulement. 

La sequence decrite par le tableau 2 montre qu'une 
operation repetitive de concatenation fait intervenir le 

5 meme regis tre de destination Rd (ici RO) . Apres seize 
concatenations, ce registre est "plein". Si I'on souhaite 
produire des chaines de bits concatenes de grande 
longueur, par exemple de 16, 32, 64 bits ou plus, on peut 
changer de registre de destination Rd apres chaque cycle 

10 de 16 concatenations. Une autre solution consists a 
conserver le meme registre Rd en sauvegardant son contenu 
apres chaque cycle de 16 concatenations. Ainsi, une 
variante de l f invention permettant de simplifier encore 
plus le format de 1 1 instruction BMV consiste a imposer 

15 l'adresse du registre de destination Rd. Dans ce cas, 
1' instruction BMV est cod6e de la fagon suivante : 


CODEbmv 


ADRs 


ADbi 


Dans ce cas, l'adresse ADRd du registre Rd, par 
20 exemple le registre RO, est generee automat iquement par 
le decodeur DEC1 sur reception du code CODEbmv- L'adresse 
ADRd peut aussi etre comprise dans le code CODEbmv qui 
peut alors etre code sur 8 bits au lieu de 4. 

II apparaitra clairement & l'homme de l'art que la 
25 presente invention est susceptible de nombreuses autres 
variantes de realisation et perf ectionnements . 

En particulier, et comme represents en traits 
pointilles sur la figure 1, le bit de poids faible 
present sur 1' entree e 0 du circuit BSHIFT peut etre 
30 conserve au moyen d'un registre LTCH en tant que drapeau 
CRY ("Carry") du microprocesseur . La sortie du registre 
LTCH contient le drapeau CRY et est connectee a l'entr6e 
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eie du circuit BSHIFT par 1 ' intermediaire d'un tampon 
BUF1, pour 1' injection 6ventuelle du drapeau CRY dans le 
chemin de donnees. Un deuxieme tampon BUF2 est interpose 
entre la sortie du circuit MUX et 1' entree el6, pour 
5 &viter les collisions entre le bit selectionne bi et le 
drapeau CRY. Le decodeur DEC1 pi lot e les tampons BUF1 et 
BUF2 en fonction du type d' instruction regue. Egalement, 
le decodeur DEC1 envoie le signal d'ecriture WRH2 au 
registre LTCH pour la mise a jour du drapeau CRY au 
10 moment de l f activation du secteur ST.2.2., quand un decalage 
a droite a ete effectu6 dans le secteur ST 2 i au cours du 
demi-cycle d'horloge precedent. 

D' autre part, le circuit BSHIFT peut etre utilise 
pour realiser des operations arithmetiques comme la 
15 division ou la multiplication, qui necessitent de fagon 
classique des decalages de bits. Sinon, le circuit BSHIFT 
peut etre dispose en d f autres points du chemin de 
donnees, par exemple entre la sortie OUTRd de la banque 
REGBANK et 1 ! entree INI de 1' unite ALU. 
20 Egalement, il est bien entendu que la concatenation 

du bit bi peut aussi etre faite par insertion du bit bi 
en tant que poids faible sur 1' entree e 0 du circuit 
BSHIFT et rotation a gauche des bits du mot binaire W2. 

Par ailleurs, 1' operation de concatenation du bit bi 
25 peut etre etendue de fa<jon simple a la concatenation 
simultanee de plusieurs bits du registre source Rs, 
selectionnes simultanement par le circuit MUX. Par 
exemple, la prevision de plusieurs circuits BSHIFT en 
cascade peut permettre de choisir entre la concatenation 
30 d'un seul bit, de deux bits a la fois, de trois bits, 
etc.. Le choix du nombre de bits a concatener peut etre 
code dans le champ CODE B mv de 1 1 instruction. 
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De fa?on generale, on a deer it dans ce qui precede 
diverses caracteristiques d'un microprocesseur permettant 
d'accelerer et de simplifier les programmes inf ormatiques 
comportant de nombreuses operations de concatenation. Ces 
5 caracteristiques peuvent etre resumees, de fagon non 
exhaustive et non limitative, comme suit : 

i) la prevision d'une instruction de concatenation et de 
moyens de decodage et de traitement de cette instruction, 
ce qui permet de simplifier l'ecriture des programmes et 

10 d'accelerer leur execution, 

ii) la prevision d'une telle instruction sous une forme 
compacte incorporant au moins une adresse de lecture d'un 
bit a concatener et le rang de ce bit, ce qui permet 
d'accelerer la lecture et le traitement de 1 ' instruction, 

15 iii) la lecture des mots Wl, W2 et 1 ? enregistrement du 
resultat W3 dans la banque de registre REGBANK du 
microprocesseur, ce qui permet de reduire la taille des 
champs adresses de 1' instruction, 

iv) 1' execution de l 1 operation de concatenation "en 
20 ligne" sur le chemin de donnees du microprocesseur, en un 

cycle d'horloge, avec presentation en parallele des mots 
Wl et W2, 

v) la realisation des trois etapes de lecture des mots 
Wl, W2,' d' execution de la concatenation et 

25 d 1 enregistrement du r6sultat W3 au cours du meme cycle 
d'horloge, grace a la division du deuxieme etage pipeline 
en deux secteurs complementaires, 

vi) la prevision d'un circuit BSHIFT a decalage par 
commutation mater ielle de fils, pouvant etre command^ de 

30 fa?on asynchrone en debut de cycle d'horloge sans 
attendre que les donnees soient stabilisees. 

En ce qui concerne la caracteristique iii), il 
convient de noter que les adresses compactes contenues 
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dans les instructions peuvent aussi permettre d'adresser 
le plan memoire du microprocesseur. Dans ce cas, ces 
adresses doivent etre transf orm6es en adresses reelles du 
plan memoire par un convertisseur d' adresses, appele 

5 unite de gestion memoire MMU ("Memory Management Unit). 

D' autre part, l'homme de l'art notera que le 
microprocesseur selon 1' invention est d'une structure 
particulierement simple garantissant une f aible 
consommation de courant. Une raesure supplementaire pour 

10 limit er la consommation elect rique cons is te a disposer 
sur les sorties OUTRs et OUTRd de la banque REGBANK des 
circuits tampons pilotes par un signal HI' decale d'une 
dur§e At relativement au signal HI. De cette manidre, 
1' unite ALU n'est connectee aux sorties OUTRs, OUTRd 

15 qu'au moment ou celles-ci sont stabilisees. Le signal 
decale HI' peut etre obtenu simplement au moyen d'un 
circuit & retard, par exemple des portes inverseuses en 
cascade. 

Enfin, il apparaitra clairement a l'homme de l'art 
20 que le terme "demi-cycle d'horloge" ne doit pas etre 
interprets de fagon limitative. En effet, a vitesse de 
fonctionnement constante, il est equivalent de prevoir un 
signal d'horloge ayant une vitesse double et de n'activer 
les secteurs pipeline qu'un cycle d'horloge sur deux, en 
25 dScalant d'un cycle d'horloge 1' activation de chaque 
secteur relativement au secteur suivant. Pour chaque 
registre pipeline Bl a B4, la selection d'un bit 
d'horloge sur deux comme signal de commande peut etre 
faite de fagon simple au moyen d'un circuit diviseur de 
30 frequence, par exemple une bascule D dont la sortie /Q 
est ramenee sur 1' entree D. Les signaux de commandes des 
registres pipeline peuvent par ailleurs etre combines 
dans des portes OU Exclusif avant d'etre appliques, afin 
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RE VEN PI C AT I ON S 

1. Microprocesseur (MP), comprenant des moyens de 
decodage (DEC1) d'une instruction (BMV) de concatenation 
d'au moins un bit (bi) d'un premier mot binaire (Wl) avec 
au moins un bit d'un deuxieme mot binaire (W2), une 
5 banque de registres (REGBANK) et des moyens (REGBANK, 
MUX, BSHIFT) de traitement de 1 ' instruction de 
concatenation (BMV), caract£ris6 en ce qu'il comprend : 

- un premier etage pipeline (ST1) comprenant les moyens 
de decodage (DEC1) de 1 1 instruction de concatenation, 

10 - un deuxieme etage pipeline (ST2), contigu au premier 
etage, comprenant 

- un premier secteur (ST21) comprenant des moyens 
(OUTRd, OUTRs, MUX, BSHIFT) de concatenation, dans lequel 
la banque de registres (REGBANK) est agencee en lecture, 

15 et 

- un deuxi§me secteur (ST22) dans lequel la banque 
de registres (REGBANK) est agencee en ecriture, 

le premier secteur etant actif a chaque demi-cycle 
d'horloge du microprocesseur et le deuxieme secteur actif 
20 a chaque demi-cycle d'horloge suivant, 

les moyens de traitement de 1 1 instruction de 
concatenation 6tant agences pour : 

- lire les premier (Wl) et deuxieme (W2) mots binaires 
dans la banque de registres (REGBANK) et ex6cuter 

25 1 1 instruction de concatenation au cours d'un premier 
demi-cycle d'horloge, et 

- enregistrer le resultat (W3) de la concatenation dans 
la banque de registres (REGBNANK) au cours du demi-cycle 
d'horloge suivant. 


WO 99/23550 


21 


PCT/m98/02266 


2. Microprocesseur selon la revendication 1, dans 
lequel les moyens (MUX, BSHIFT) de concatenation (BMV) 
comprennent : 

- des moyens (OUTRd, OUTRs) de presentation en parallele, 
5 sur le chemin de donnees (DPTH) du microprocesseur , des 

deux mots binaires {Wl, W2) lus dans la banque de 
registres (REGBANK) , 

- des moyens (MUX) de selection d'au moins un bit (b±) a 
concatener du premier mot binaire (Wl) , et 

10 - des moyens (BSHIFT) pour decaler des bits du deux i erne 
mot binaire (W2) sur le chemin de donnees (DPTH) et 
inserer dans le deuxi&me mot binaire (W2) au moins le bit 
select ionne (bj.) du premier mot binaire (Wl) . 

3. Microprocesseur selon la revendication 2, dans 
15 lequel lesdits moyens pour decaler des bits comprennent 

un circuit (BSHIFT) a commutation materielle de fils 
agence pour, sur reception d'un signal de decalage (SR) , 
d6caler le rang des fils du chemin de donnees (DPTH) et 
connecter a au moins un fil (si 5 ) du chemin de donnees la 
20 sortie (ei 6 ) des moyens (MUX) de selection du bit (bi) a 
concatener. 

4. Microprocesseur selon l'une des revendications 2 
et 3, dans lequel les moyens de selection d'au moins un 
bit comprennent un circuit multiplexeur (MUX) agence sur 

25 le chemin de donnees (DPTH) pour recevoir en entree le 
premier mot binaire (Wl) . 

5. Microprocesseur selon l'une des revendications 1 
a 4, dans lequel le deuxieme mot binaire (W2) est lu dans 
la banque de registres (REGBANK) a l'adresse (ADRd) 

30 d f enregistrement du r£sultat (W3) de la concatenation. 

6. Microprocesseur selon l'une des revendications 1 
a 5, comprenant des moyens de decodage (DEC1) d'une 
instruction compacte de concatenation (BMV) comportant 
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une adresse compacte (ADRd) d'enregistrement du resultat 
(W3) de la concatenation. 

7. Microprocesseur selon l'une des revendications 1 
a 5, comprenant des moyens de decodage (DEC1) d'une 

5 instruction de concatenation (BMV) dont le code (CODEbhv) 
comport e une adresse compacte (ADRd) predeterminee 
d 1 enregistrement du resultat (W3) de la concatenation. 

8 . Microprocesseur selon 1 1 une des revendications 1 
a 5, dans lequel les moyens de decodage (DEC1) de 

10 1 1 instruction de concatenation (BMV) sont agences pour 
generer une adresse (ADRd) fixe et predeterminee 
d* enregistrement du resultat (W3) de la concatenation. 
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